1
模型适配的光谱
AI030Lesson 5
00:00

想象一个大型语言模型(LLM)就像一位才华横溢但领域广泛的学者。要将这位通才转变为专业人才——例如临床放射科医生或合同律师——我们需要在 模型适配的光谱中前行。这一光谱定义了我们如何从零样本提示过渡到深层神经网络修改,同时在硬件限制与对 前沿水平(SOTA) 结果的需求之间取得平衡。

适配连续体控制力与稳定性(递增 →)上下文学习PEFT / LoRA全量微调

关键适配模式

  • 上下文学习(ICL): 模型保持“冻结”状态。它通过观察提示内部的示例来估计 $P(y|x)$。虽然速度快,但通常容易出现高方差和幻觉问题。
  • 对齐性与稳定性: 要达到生产级别的可靠性,我们必须向光谱右侧移动。微调能提供更佳的 与人类判断的对齐性 通过明确惩罚偏离真实模式的行为来实现。
  • SOTA目标: 实现顶级性能需要权衡利弊。全量微调提供了最大控制力,但存在‘灾难性遗忘’的风险,而 PEFT(参数高效微调) 则提供了一个对硬件友好的中间方案。
现实案例
设想一个医疗助手。使用 ICL,你将在提示中提供三个症状到诊断的示例。使用 微调,你用5万份病历数据训练模型。后者得到的模型能自然理解临床术语,并展现出远超前者的 一致性和稳定性